package com.shujia.ml

import org.wltea.analyzer.core.{IKSegmenter, Lexeme}

import java.io.StringReader
import scala.collection.mutable.ListBuffer

object Demo08IK {
  def fit(str: String): String = {
    val reader: StringReader = new StringReader(str)
    val ik: IKSegmenter = new IKSegmenter(reader, true)
    var lexeme: Lexeme = ik.next()
    val lb: ListBuffer[String] = ListBuffer[String]()
    while (lexeme != null) {
      lb.append(lexeme.getLexemeText)
      lexeme = ik.next()
    }
    lb.mkString(" ")
  }

  def main(args: Array[String]): Unit = {
    val text: String = "机器学习课程内容真好玩"
    // 秋燥易上火热伤风不好受下场打球运动出出汗呼吸下新鲜的空气瞬间精神舒服很多。
    // 秋燥 => 对所有的可能出现的词语进行编号 0-N 我 0 爱 9999 秋天 555  =词向量=> [0,9999,555]
    println(Demo08IK.fit(text))
  }

}
